科研星球

肿瘤表观遗传相关重磅数据库:MR4Cancer使用指南

在癌症阶段的转变过程中,主调控子(master regulator,MR)是指通过协调相关的靶基因来控制癌症发生和发展的关键基因。由于其固有的重要性,MR可以作为癌症诊断和预后的重要生物标志物和治疗靶点。开发一个简单易用的识别工具就显得尤为重要了。来自香港大学的开发者就做了这件事情,开发了MR4Cancer数据库。


0.png


MR4Cancer数据库(http://cis.hku.hk/MR4Cancer)的开发者来自香港大学生物科学学院,数据库相关文章(PMID: 30052770)于2019年2月发表在Bioinformatics杂志(2019IF=5.612)上。截至2021-05-24该数据库相关文章已引用2次(数据来源:PubMed)。


0 (4).png


我们可以看到在MR4Cancer数据库选择相应的癌种之后,可以根据用户的需求输入两种数据——基因列表或者基因表达矩阵。


0 (7).png


基因列表


我们以GBM胶质母细胞瘤为例依次来进行查看。


0 (1).png


提交之后会得到一个Job ID,用于查看结果。


0 (6).png


结果部分主要包括五部分(最上方的Job ID就是我们之前获得的ID)。


0 (2).png


1

总结



主要由输入部分和输出部分两部分组成。


0 (3).png


输入部分显示了选择的癌种(GBM)和输入的139个基因名,点击后面的“Details”可以查看具体的基因。


输出部分根据校正后的P值<0.05为阈值统计了所以的上调的MR及其GO和通路富集的结果。



2

MR


数据主要分为转录调控、非转录调控、miRNA、复发突变基因、ChIP-Seq 转录因子、PWM转录因子、信号蛋白和PPI-Hub八大类,每个大类后面括号内的数字表示该类的结果数目,单击可进行展开查看。


640.png


每个大类下的条目大同小异,都含有编号、MR、与输入基因的重叠数目、转录子数目、P值、调整后的P值等信息。


单击MR可查看具体详情。主要包括一般信息、表达情况、表达量和hallmark分值的相关性和突变效用四部分。


0 (14).png


一般信息显示了MR的缩写、全名、染色体定位和相关数据库的超链接。


0 (9).png


表达情况以正常对照和肿瘤组进行分组,以箱式图显示了两组的表达情况。


0 (10).png


数据库以热图形式展示了表达量和hallmark分值的相关性。


0 (11).png


需要有足够的数据才会显示突变效用相关信息。


0 (12).png


3

GO


包括常规的BP、MF和CC三大板块。


0 (13).png


显示内容与MR类似,包括编号、GO、与输入基因的重叠数目、GO条目下基因的总数目、P值和调整后的P值等信息。


0 (14).png


4

通路分析


除了我们最常见的KEGG通路外,还有Reactome、BioCarta和PID通路。


0 (15).png


显示内容包括编号、通路名、与输入基因的重叠数目、通路条目下基因的总数目、P值和调整后的P值等信息。


0 (16).png


点击通路名会跳转到该通路的相应页面。

0 (17).png


5

网络可视化


主要包括网络图和网络图的输出结果两部分。

0 (19).png


在网络图部分,用户可以根据自己的需求进行简单的自定义,主要包括①MR个数及来源、②节点颜色和③节点大小的自定义。


0 (18).png


网络图可以进行随意的拖动、刷新样式和下载。以菱形表示MR,以圆形表示MR的靶点。单击各个节点均会显示该节点在所选癌种中的相关信息。

0 (20).png


鼠标悬停在节点会显示该节点的名称及与该节点想联系的节点的数目,此时也数据库也会将该节点及其相关网络突出显示。


0 (21).png


而鼠标悬停在连线上时会显示该连线两端的节点的名称及其方向。

0 (22).png


网络的输出结果主要包括Degree和Betweenness内容,均是以柱状图表示。

0 (23).png

鼠标悬停在柱条上会显示具体的信息。


0 (24).png

基因表达矩阵


我们以肝细胞癌和示例数据进行查看。

0 (25).png

提交之后数据库会使用limma包进行差异分析,点击“Details”可查看具体的结果。

0 (26).png

然后需要用户从两种确定MR的方法中选择一种。我们以第一种(快速获取)为例。

0 (27).png

结果页面与之前的基因列表的大同小异,只是数据库根据MR的激活或抑制分为了相应的红色和蓝色显示。感兴趣的小伙伴可以自行探索。

0 (28).png

需要说明的是数据库贴心地提供了数据结果重览选项,用户可以使用之前获得的Job ID无限次查看结果。

总的来说,开发者通过分析TCGA的高通量组学数据,产生了26种肿瘤类型的肿瘤特异性调控子,并从公共数据库中提取了非肿瘤特异性调控子。随后,开发者将这些规则与统计推断结合起来,以识别和优先排序感兴趣的表型差异的MR。此外,MR4Cancer数据库还为MR-靶关系提供了动态网络可视化,用户可以交互式地查询网络以产生新的假设和高质量的数据以供发表。开发者期望这个用户友好且功能强大的网络工具可以为研究人员提供肿瘤发生和治疗干预的新见解。



没有账号?